#expectativas de usuario

DailyReport: Evaluación de agentes de búsqueda en tareas diarias

Descubre cómo el nuevo benchmark DailyReport evalúa agentes de búsqueda basados en IA en tareas cotidianas. Resultados muestran que aún no cumplen expectativas.

2026-06-12 · 2 min